[セッションレポート] ムーディーズがESGスコアにサーバーレスやマイクロサービスを活用する方法 (FSI205) #reInvent
AWS認定トレーニング講師の平野@おんせん県おおいたです。
今日は「How Moody’s uses serverless and microservices for ESG scores」というタイトルのセッションについてレポートします。
セッション紹介
環境、社会、ガバナンス(ESG)への配慮は、金融市場および投資家のリスクベースの意思決定を再形成しています。ムーディーズは、ESGデータに基づくスコアを透明性をもって公表し、詳細な分析をサポートするスケーラブルなソ リューションを提供しています。ESGの結果は、顧客向けプラットフォームやポートフォリオ管理のためのリスクベースモデルに組み込 まれます。そのためには、複数のデータソースを統合し、データをクレンジングし、手作業で操作することなく分析することが必要です。本セッションでは、ムーディーズがこの課題に対処するために、スケーラブルなサーバーレスプラットフォームをAWS上に構築した方法を学びます。ムーディーズは、そのサーバーレスおよびマイクロサービス・アーキテクチャにより、AWSサービスを使用して、データのリネージと透明性を備えたESGスコアをシームレスに公開する方法を共有します。
オンデマンド動画
概要
- ESGは、多くの非財務的要素を包含しています。
- 環境保護
- 自然環境の保全と保護
- 炭素排出量
- 水資源使用量
- 廃棄物管理方針
- 自然環境の保全と保護
- 社会
- 従業員、サプライヤー、顧客、地域社会との関係
- 従業員の多様性
- 同一賃金に関する方針
- 安全衛生方針
- 従業員、サプライヤー、顧客、地域社会との関係
- ガバナンス
- 会社のリーダーシップ、リスク管理、および株主の権利に関する基準
- 取締役会の構成
- 役員報酬
- 税務戦略
- 会社のリーダーシップ、リスク管理、および株主の権利に関する基準
- 環境保護
- ESGの優先順位は市場セグメントによって異なる
- ESGデータを融資、引受、投資プロセスに統合することにより、新しいESG商品とサービスを構築する。
- ファイナンスの排出量を定量化し、気候変動リスクをリスク管理フレームワークに統合する
- 進化する基準や規制に沿ったESG指標の報告
- きめ細かいESGデータへのニーズと強固なESGデータガバナンスをドライブする
- ESGデータの収集は困難
- ESGデータを報告するための単一の基準がないため、多様で不完全、かつ相関性のないデータセットになっている
- ESG報告の頻度が低いため、質の高いタイムリーなデータにアクセスすることが困難
- ESGスコアリングモデルがESGファクターに異なるウェイトを適用することを要求するため、ESGデータから投資に関する洞察を得ることができない
- ESGに関連する重要な価値
- 110兆ドルの金融資産のうち40%がESGを考慮した運用をしている
- 2020年1月から11月までに投資家が投資信託やETFでサステナブル資産に投資した額は2880億ドル、2019年比で96%増となった
- 世界的に代表的なサステナブル・インデックスセレクションの81%が、2020年中に親ベンチマークをアウトパフォームした
- 5億5000万ドルは、ESGデータに最も多額の支出をする資産運用会社が、2021年にESGデータに費やすと推定される金額
- ムーディーズのゴールは?
- リスク管理および評価におけるムーディーズのリーダーシップと実績を基盤に、厳格で透明性の高い ESGおよび気候変動に関するソリューションとデータに対する市場の高まる需要に対応する
- データの系統性と透明性を備えたESGデータおよびSFDRレポートを発行する
- ESGデータをムーディーズの関連するリスクモデルやプラットフォームに組み入れることで、新たな収益源を導入する
- ゴールから逆算すると
- 1.方法論と必要なデータ要素をサポートするESGリファレンスデータ
- 2.ウェブサイトから収集され、データファクトリに保管された企業に関する文書
- 3.AI/MLを使用して、保存された文書から主要なパラグラフとデータポイントを抽出します。
- 4.データアナリストのレビューとエンリッチメントをサポートするために使用されるエンリッチドデータポイントの出力
- 5.社内外に配信されるデータとスコア
1. ESGリファレンスデータ
- リファレンスデータ表
- スコアリング対象企業、柱、基準、指標、それらの関係性など、ESGデータ収集に必要なリファレンステーブルのリストを作成
- リファレンスデータのソーシング
- このリファレンスデータを確立するために必要な様々な信頼できる日付ソースを設計し、さらにDeek、AWS Glue、Amazon S3を使って構築
- リファレンスデータの管理
- ユーザーがリファレンスデータにアクセスし、更新できるようなUIとエンドポイントを構築し、リファレンスデータを効果的にレビューおよび管理(データの依存関係が明確で自動化されている状態)
- 課題
- リファレンスデータのガバナンスと管理を確立し、記録システムを一元化し、データが下流で適切に使用されるようにする
- 企業の商品・サービス(信用格付やリスク評価商品を含む)で使用される企業分類の作成
- リファレンスデータとその依存関係を管理するためのプラットフォーム構築
2. ドキュメント収集
- アナリストによる公開情報の収集
- アジア・EMEAのグローバルESGアナリストが、公開された数十万件のESG関連レポート/開示を収集し、これらの文書はUIを使用して保管
- 文書のメタデータを収集
- メタデータを取得し、その文書が属する企業に関連付け、メタデータのタグが付けられたバケットに文書を保存
- ML処理のためのデータバッチの準備
- 論理的にML処理の準備が整ったポートフォリオに基づいて文書にタグ付けし、バッチをスケジューリング
- 課題
- 非標準的なESG報告の結果としてのデータの不整合と手作業による収集
- データのリネージとドキュメントのバージョニングの維持
- リンクが予告なしに更新されるため、自動化が必要となり、アナリストの作業時間が増加
3. ドキュメントからデータポイントを抽出
- ML APIにポートフォリオを提出
- ドキュメントが収集されると、それらは企業セクターと完全性に基づいてポートフォリオに整理されます。これらのポートフォリオは、ESGに関する事前に定義された質問に対する回答を処理し抽出するために、AI/MLモデルに提出されます。
- 抽出されたデータの収集、照合、保存
- メタデータを取得し、文書が属する企業に関連付けます。文書は、メタデータがタグ付けされたバケットに保存されます。
- 課題
- 冗長、重複、空白の抽出データ
- MLモデルによる能動学習
- テーブルや複雑なデータを、下流のシステムで消費可能なレイアウトに抽出するのは難しい
- データ系統の欠落(例えば、抽出データのページ番号など)
- MLモデルのスケーリング
4. データポイントの検証・認証
- データポイントの取得とリッチ化
- ML APIから受け取ったデータポイントは、メトリックの標準化、参照データのタグ付け、分析を容易にするために重複しているように見えるレコードの表示などを行う
- アナリストによる検証プロセス
- ESGの専門知識を持つアナリストが2段階でデータをレビューし、必要に応じて欠損データの追加や集計を行う。すべてのデータポイントは、認定される前に4人の異なるレビュアーによってレビューされ、これらはすべてカスタムメイドのUIを使用して実行
- データポイントの販売
- データが認証されると、そのデータは世界中で利用できるようになり、下流工程ではレポート作成とスコアリングのためにこの情報を取り込む
- 課題
- 1,000万件のデータポイントをサポートするスケーラブルなアーキテクチャ
- 全世界のアナリストの時間を最適化するための高可用性
- 進化するプロセスとデータ要件に対応するため、柔軟性とデータ修正への対応力をテスト
- 一貫性を確保するためのデータ検証の統合
5. ESG データとスコア
- Ready to roll
- アナリストは、企業のデータの完全性を確認し、データが準備できた企業のレポートを作成。この事前調査の結果は、その後のプロセスの引き金となる
- 企業の検証およびスコアリング
- データポイントは自動化されたスクリプトによって再度独自に検証され、スコアリングされる。エンティティが正常にスコアリングされると、最終的にデータレイクに転送。
- スコアの下流への配信
- データが認証されると、そのデータはグローバルに利用できるようになり、下流工程ではレポートやスコアリングのためにこの情報を引き出すことができるようになる
- 課題
- データ要件と採点モデルの整合性を確保するための異なるチーム間の調整
- 継続的なモデルの変更に対応し、データ要件を変更する必要がある
- リアルタイムまたはバッチの柔軟性
- データが収集されたドキュメントを指し示すデータリネージ
- 消費者の要求に応じてスコアを再公開
サーバーレスアーキテクチャの回復力
- ゴール
- アナリストの生産性を確保するために、複数の地域にまたがるRTO<1時間、RPO<1時間のディザスタリカバリ
- システムが停止した場合でも、コミットされたデータが永続的に存続できるようにするためのデータの耐久性
- SLAを維持し、可能な限りカットオーバーを自動化するための地域間の冗長性
- ストレス下でアプリがどのように動作するかを文書化し理解するための、「非機能的」な弾力性テスト機能
まとめ
環境、社会、ガバナンス(ESG)のスコア化についてのセッションを紹介しました。ご興味があれば上記のリンクよりセッション動画をご覧ください。